因為工作性質的關係,不時會有朋友找我討論,如何把他們絕妙的好點子製作成可以賺錢的 App。
我生性不是喜歡潑人冷水的人,而且大部分的時候,其實這些點子都還不錯,有的想法非常有創意,有的很有商機,但是大部分的情況下,要想成為一個完整的產品,好像也都少了一點什麼。
如同兵法裡有「戰略」、「戰術」、與「戰技」三種層次的區分,要「開發行動應用」,一樣可以分成「商業模式」、「架構」與「技術」三個層次來討論。
一般程度的開發者,只要稍加學習就可以掌握基本的語法和開發工具,用現有的函式庫與工具製作出各式各樣的功能。這樣算是開發 app 的「戰技」,不斷精進下去,會對於開法的技巧更為熟練,並且能整合更多的第三方函式庫或其他資訊系統。
戰術層次,則可以對應到軟體開發的架構(software architecture)。好的架構,可以簡化維護的流程,降低再次開發類似軟體的成本,甚至製作成軟體框架,成為第三方的函式庫。這個層次,可以看做是透過「流程控管」,讓實作更有效率。
一個 app 解決了什麼問題、能不能讓人願意使用、是不是達到原本要開發的目的,則是屬於商業模式的部份,可以對應到兵法的「戰略」層次。這個層次的掌握其實是相當有難度的,必須要對消費者與市場有相當程度的了解,還要對技術的可行性有一定的認識,當然,最好還要有一些商業嗅覺。
雖然說是「商業」模式,但是其實不見得每個行動應用的開發都是以營利為目的,所以這個部分比較像是整個專案的策略目標是不是能夠達成。簡單的說,就是「為什麼」要開發這個行動應用?這個行動應用是不是有解決你的問題,或是達成你的目的?
會來找我討論的,有的是在自己的領域學有專精或耕耘多年,想把一些原本的應用拓展到行動領域;有的是心中長久以來一直有個想法,想透過行動平台來實現的;有的是突然想到什麼「好點子」,想趕快設法製作成 app,免得被人搶先的。
整體來說,跟第一種對象溝通是最容易的,因為他們通常都已經有相當明確的「商業模式」,缺少的只是技術支援,只要不是太複雜的內容,通常很快可以完成架構的設計與初期製作。
第二種情況,則是最費力的。因為「想法」跟「概念」往往是很抽象的,需要很多的時間溝通,才能夠逐漸具體化,而具體化的概念,常常也不見得有合理的商業模式。也由於出發點比較抽象,在製作的過程中,常常會出現「這不是我想要的」的狀況,以致整個流程必須從頭來過。由於筆者自己會切入行動應用這個領域,也是出自於相似的理由(只不過我是自己學會做而不是找人幫我做),所以遇到這樣的朋友,我通常會當作是做善事,慢慢跟他們討論。有時候討論到某個段落的時候,會發現他們需要的根本不是一個行動應用,而是其他的東西。(感覺起來,這比較像是在做心理諮商 XD)
第三種情形,是比較常需要扮演潑冷水的角色的時候。忘了是誰說過的:「當你想到一個好點子的時候,請假設世界上至少有另外兩個人也想到了」,但是當人覺得自己「想到好點子」的時候,通常會有點熱情的衝動,以至於很容易忽略了三個層次裡的某些環節。當然,潑人冷水也是要有點技巧的,不過那不是這裡要討論的事情了。
雖然這裡說的是行動應用,但是回頭想想,其實在提供一些 predictive modeling 方面的諮詢時,常常也會遇到類似的情況。常常有人會想要用 visual recognition 來解決一個簡單的 regression 問題,或是想要用最「新」最「炫」的工具,期待能為原來遇到瓶頸的問題帶來一些新的突破。這些事情雖然都是可執行的,但是我總是要問清楚:「你想這樣做的目的是什麼?你確定這樣做有達成你的目標?」
問對問題,就好像戰略上要弄清楚「為何而戰」,後面的技術與架構,也才能發揮他們的價值。
2012/12/21
2012/12/11
設計思考與演化算法
How Design Thinking works, or: Design Thinking Unpacked: an evolutionary algorithm? from J. M. Korhonen
Design Thinking 是這幾年頗為熱門的一套創新方法學,史丹佛大學今年秋季甚至還開設了教導如何利用這套方法從事創新、為期一年的學程。究竟這個方法是什麼呢?根據「設計思考改變世界」這本書的說法:
設計思考源自於設計師們花費數十年時間孜孜學習的技能,他們在種種現實條件的束縛下,努力用可以取得的科技資源來滿足人類的需求。設計師從人的觀點出發,把人們渴望的東西與技術上可行和經濟上實惠的條件整合起來,藉此創造出我們今日所享用的產品。設計思考則更進一步,把這些工具交到那些從沒以設計師自居的人們手上,讓這些工具應用到更廣泛、更重要的問題領域。下面這段影片有更詳細的敘述。
「設計思考」與 「以使用者為中心的設計」(user-centered design, UCD )有著千絲萬縷的關聯,前者比較接近一套完整的專案執行流程,而後者比較像是設計的理念,以及相關的方法與工具的集合。由於近年來「使用者體驗」(user experience, UE or UX)逐漸成為產品與服務設計的重要指標,相關的方法與流程也顯得日益重要。
雖然說「設計思考」是由設計師所提出,其實對於學理工的人來說,它的核心概念跟傳統的「科學方法」並無二致,但是由於強調「跨領域團隊」與「產生實際產品與服務設計」,而多了許多實務上的方法與建議,因此在專案執行上特別有參考價值。
在實際執行上,設計思考包含了從消費者需求的研究開始,到產品設計、原型製作,檢討改進的一整套流程(詳情可參考文末的投影片),多年來也大量的應用在各種創新的專案上,然而還是有很多人會懷疑:「這套方法真的有用嗎?」
除了實際產品上眾多的證據之外,芬蘭的 Korhonen 教授也試圖提出一些理論上的解釋。「演化演算法」(evolutionary algorithms)屬於演算法上的一個分支,用在許多複雜問題的「最佳化」上相當有效率,而設計思考的流程與這類演算法的結構非常類似,都有「產生許多可能的方案」、「評估每個方案」、「選擇最適合的幾個方案加以組合」、「反覆製作原型並進行修正」這些過程,Korhonen 試圖以此論述來替設計思考背書,證明設計思考在理論上就是行得通的。筆者剛好在演化算法上有些許涉獵,其實這類演算法在學術界面臨最大的攻擊就是「實務上每次都很有用,但是理論上無法證明它一定有用」,所以 Korhonen 教授的用意雖好,但恐怕還是未竟全功。
最後附上以前演講的投影片,裡面有稍微詳細一點的介紹,以及一些相關影片的連結,包含一個實際案例,以及推廣設計思考的紀錄片。
。
Labels:
innovation,
thoughts
2012/12/02
[Data Analytics] 關於資料與分析的 31 句名言
原文:31 Essential Quotes on Analytics and Data | Web Analytics Action Hero
原文的作者摘錄了一些名句放在自己的著作裡,按照一些主題做了分類。
自己特別有感覺的,是愛因斯坦的那句:如果你無法簡單的解釋一件事情,那麼表示你對這件事情的理解不夠透徹(If you can’t explain it simply, you don’t understand it well enough)。
在專業訓練的過程中,我們會學到很多的術語跟複雜的概念,用來跟同行的人做更有效率的溝通。所以在這個階段,我們通常會用這些「裝備」把自己武裝起來,讓自己顯得「高人一等」、「連講的話都不一樣」。但是進到了另一個階段,我們一方面對專業領域有了更深一層的理解,一方面可能必須向外行人解釋這些複雜的概念,於是就有了以簡馭繁的需要。我相信愛因斯坦的這句話,應該是在描述這個進階的專業水準,畢竟必須依靠「讓別人不懂」來凸顯自己專業能力的人,可能在專業上還有很多可以進步的空間。
另外,像是「讓數字說話」這一類的有好幾句,但是個人一直不覺得數字本身能說什麼話,通常是「懂數字」的人,能讓數字說他想要說的話。這個部分有很多有趣的例子,以後再以另外的文章討論好了。
原文的作者摘錄了一些名句放在自己的著作裡,按照一些主題做了分類。
自己特別有感覺的,是愛因斯坦的那句:如果你無法簡單的解釋一件事情,那麼表示你對這件事情的理解不夠透徹(If you can’t explain it simply, you don’t understand it well enough)。
在專業訓練的過程中,我們會學到很多的術語跟複雜的概念,用來跟同行的人做更有效率的溝通。所以在這個階段,我們通常會用這些「裝備」把自己武裝起來,讓自己顯得「高人一等」、「連講的話都不一樣」。但是進到了另一個階段,我們一方面對專業領域有了更深一層的理解,一方面可能必須向外行人解釋這些複雜的概念,於是就有了以簡馭繁的需要。我相信愛因斯坦的這句話,應該是在描述這個進階的專業水準,畢竟必須依靠「讓別人不懂」來凸顯自己專業能力的人,可能在專業上還有很多可以進步的空間。
另外,像是「讓數字說話」這一類的有好幾句,但是個人一直不覺得數字本身能說什麼話,通常是「懂數字」的人,能讓數字說他想要說的話。這個部分有很多有趣的例子,以後再以另外的文章討論好了。
Why Analytics?
- What gets measured, gets managed. --Peter Drucker
- The price of light is less than the cost of darkness. -- Arthur C. Nielsen, Market Researcher/Founder of ACNielsen
- Without big data analytics, companies are blind and deaf, wandering out onto the Web like deer on a freeway. -- Geoffrey Moore, Author of Crossing the Chasm/Inside the Tornado
- Those who do not remember the past are condemned to repeat it. -- George Santayana
- War is ninety percent information. -- Napoleon Bonaparte, French Military and Political Leader
Uninformed Opinions and Theories
- A point of view can be a dangerous luxury when substituted for insight and understanding. -- Marshall McLuhan, Canadian Communications Professor
- In God we trust, all others must bring data. -- W. Edward Deming
- I never guess. It is a capital mistake to theorize before one has data. Insensibly one begins to twist facts to suit theories, instead of theories to suit facts. -- Sir Arthur Conan Doyle, Author of Sherlock Holmes stories
- He uses statistics as a drunken man uses lamp posts – for support rather than for illumination. -- Andrew Lang, Scottish Writer
- Facts do not cease to exist because they are ignored. -- Aldous Huxley
Data Matters
- Data! Data! Data! I can’t make bricks without clay! -- Sir Arthur Conan Doyle
- Not everything that can be counted counts, and not everything that counts can be counted. -- Albert Einstein, Physicist
The Process of Analysis
- If you don't know how to ask the right question, you discover nothing. -- W. Edward Deming
- A person who is gifted sees the essential point and leaves the rest as surplus. -- Thomas Carlyle, Scottish Writer
- He who would search for pearls must dive below. -- John Dryden
- Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital. -- Aaron Levenstein, Business Professor at Baruch College
- If you torture the data long enough, it will confess. -- Ronald Coase, Economist
- Errors using inadequate data are much less than those using no data at all. -- Charles Babbage
- The alchemists in their search for gold discovered many other things of greater value. -- Arthur Schopenhauer, German Philosopher
Sharing Your Data and Insights
- Once we know something, we find it hard to imagine what it was like not to know it. -- Chip Dan Heath, Authors of Made to Stick, Switch
- If you can’t explain it simply, you don’t understand it well enough. -- Albert Einstein, Physicist
- If the statistics are boring, you've got the wrong numbers. -- Edward Tufte
- The greatest value of a picture is when it forces us to notice what we never expected to see. -- John Tukey, American Mathematician
- Data are just summaries of thousands of stories – tell a few of those stories to help make the data meaningful. -- Chip Dan Heath, Authors of Made to Stick, Switch
- Numbers have an important story to tell. They rely on you to give them a clear and convinving voice. -- Stephen Few
Turn Insight into Action
- The goal is to turn data into information, and information into insight. -- Carly Fiorina, Former CEO of HP
- The value of an idea lies in the using of it. -- Thomas A. Edison, American Inventor
- An idea not coupled with action will never get any bigger than the brain cell it occupied. -- Arnold Glasow, American Businessman
- Any powerful idea is absolutely fascinating and absolutely useless until we choose to use it. -- Richard Bach
- Never confuse motion with action. -- Benjamin Franklin, American Politician/Inventor
- Opportunities multiply as they are seized. -- Sun Tzu
Labels:
data analytics
[Data Analytics] 隱馬可夫模型(Hidden Markov Model):探索看不到的世界的數學工具
Hidden Markov Model 是機器學習(Machine Learning)領域中常常用到的理論模型,從語音辨識(Speech Recognition)、手勢辨識(gesture recognition),到生物資訊學(Bioinformatics)裡的種種應用,都可以見到這個工具的身影。
既然名字裡有「馬可夫」,想當然耳的,這又是一個馬可夫模型(Markov model)的延伸。之前在介紹 n-gram 的文章裡已經提到過,馬可夫模型所描述的,是一連串事件接續發生的機率:
馬可夫鏈,用白話說,就是同類型的事件(不同的狀態)依序發生的機率,舉例來說,假設天氣有三種狀態:「晴天」、「陰天」跟「雨天」。如果昨天是雨天,那麼今天是「雨天」的機率,會跟昨天是「晴天」而今天是「雨天」的機率有所不同,這是因為我們相信天氣現象在時間上有某種連續性,前面發生的狀態會影響到後面發生的狀態,而馬可夫模型就是描述這種前後關係的數學語言。那麼,「隱馬可夫模型」,顧名思義的,約莫就是有什麼東西「隱藏」起來了。我們沿用之前天氣的例子,假設我因為腳受傷,必須住在一個房間裡,看不到外面的天氣(我知道這聽起來不太合理,但是我實在不想把自己關在禁閉室裡,所以請通融一下),但是我可以看到我隔壁房間的室友每天從事的運動:「跑步」、「健身操」或是「游泳」三者之一。
如果把室友每天從事的運動項目記錄下來,就是他「運動」這個事件的馬可夫鏈,這是我可以觀察的到的現象。然後,我又依照過去的經驗,知悉在每種天氣狀況下,他從事各項運動的機率,那麼我是不是可以透過我的觀察和知識,去推測每天的天氣?
在這個例子裡,有兩個事件的序列:一個是我觀察得到的,室友每天所從事的運動項目;另一個是我看不到的,也就是對我來說是隱藏的,外面每天的天氣。由於我知悉這兩個馬可夫鏈之間的關係,所以我便可以由其中一個馬可夫鏈的狀態,去預測另一個馬可夫鏈的狀態。而「隱馬可夫模型」,便是描述這樣的兩個序列的關係的統計模型。
簡單的說,「隱馬可夫模型」提供了一套數學的理論以及工具,讓我們可以利用「看得到的」連續現象去探究、預測另一個「看不到的」連續現象。
當然,這裡的「看不到」並不表示真的無從觀察,以前面所舉的例子來說,我在腳沒受傷的時候,還是可以到外面去觀察天氣的,只是在某個特定的條件之下,天氣對我來說被隱藏起來了。
文章的附圖,講的是柏拉圖的洞穴預言(Allegory of Cave),講的是「我們看到的世界」跟「真實的世界」的關係,或許恰好可以用來比喻一下隱馬可夫模型的作用。
我們還可以進一步用「語音辨識」當做例子,來說明 HMM 的用處。
在語言學上,我們可以把人說話發出的聲音分成各種音節(syllable),所以理論上,我們如果有一段錄音,只要能分辨每一個音節發的音是哪些母音與子音,就能夠把這個人講的話辨識成文字。
任何「理論上」可行的事情,必然伴隨著實務上的困難。
這種「音節對應」的工作看似容易,但是實際上會遇到很多「模稜兩可」的情況。以中文為例,兩個三聲的字連著念,前面的會讀成二聲,加上同音字、破聲字,同字的語音與讀音...等等,都增加了這個「分辨」過程的難度。
那麼,HMM 是怎麼跑進來的呢?試想,「語音」,是一連串的「音節」,而我們想要辨識成的文字,則是一連串的「字」;對語音辨識系統而言,語音這個「音節序列」是看得到的訊號,而系統想要做的是推測出與其相對應的,看不到的「文字序列」,所以正好是 HMM 所模擬的狀況。隱馬可夫模型在語音辨識的的應用,大抵始於1970年代晚期的 IBM 計畫(Jelinek),時至今日,我們生活中可以看到的各種語音辨識系統,例如 Apple 的 siri,Google 的 voice search,微軟前不久在北京展示的中英同步口譯,背後都是以 HMM 作為基礎技術。至於技術的細節,有興趣可以參考 MIT 的教材,這裡就不討論了。
生物資訊學(bioinformatics)是另一個大量使用到 HMM 的領域,從 DNA 序列的比對到演化歷程的推論,只要是跟基因序列有關的,幾乎都看得到 HMM 的應用。以DNA定序為例,一段採集到的DNA序列,包含了「外顯子」(exon)和「內隱子」(intron)兩種段落,兩者在細胞複製時有不同的功能,但都是由眾多的基因(gene,有A, T, C, G 四種)排列成的序列。因此,在一串看得到的基因序列中,要如何標記出哪一段是「外顯子」,哪一段又是「內隱子」,這些看不到的段落,也是 HMM 可以發揮作用之處。簡單的說,「外顯子」和「內隱子」各自包含 A,T,C,G基因的比例不同,於是我們可以利用 HMM 相關的演算法,找出哪一個基因是「外顯子」和「內隱子」的起點或終點。
現實中,股票的價格變化也是一個「序列」,這是另一個充滿經濟誘因的預測標的,想當然耳的,也有不少人把 HMM 運用在預測股價的狀態上,不過文獻就不如前述兩個領域那麼豐富了。
隱馬可夫模型當然也有它使用上的限制。例如,觀測與模擬的現象必須是「序列」(或者該說是馬可夫鏈),兩個序列之間的關係要夠明確等等,否則很容易就變成用十字螺絲起子去轉六角螺絲:或許可以運作,但是結果不盡然是原本想要的。
如果有這樣的數學工具,你會想要用來預測什麼看不到的現象呢?
Labels:
data analytics,
tech,
thoughts
2012/11/12
[摘譯] 不上臉書也不能保障你的隱私
原文:Staying Off Facebook Won't Protect Your Privacy
很多人相當重視自己的隱私,不想被人知道自己在做什麼,所以對於社群網路如臉書(Facebook)之流一向都敬而遠之。但是,這樣真的就可以保持神祕嗎?答案恐怕不是那麼樂觀,一旦有了社群網路,你可以逃,但是終將無處可躲。
近日發表在 PLOS ONE 的一篇學術論文,「社群網路上,一加一等於三」(One Plus One Makes Three (for Social Networks)
),德國的學者發現,他們可以利用社群網路上會員所分享的資料,來了解非會員之間的關係,例如他們是否彼此認識等等。
也就是說,即使有人因為不想洩漏隱私而拒絕使用臉書,最終也將由於他的朋友的活動,而讓這個「非使用者」的社群關係被預測出來。
這群研究人員,使用的都是屬於「公開」的資料,而社群網站的經營者可以使用的資料更多,包括性別、年齡、教育程度等等,如此能夠做出的預測,恐怕就不只是「誰認識誰」而已了。
這樣的研究結果,提醒了我們必須重新去思考,在這個資訊時代,我們必須更嚴肅的看待「關係」這種資料的所有權以及可能的濫用(譯按:真的是很德國的想法 XD)。
很多人相當重視自己的隱私,不想被人知道自己在做什麼,所以對於社群網路如臉書(Facebook)之流一向都敬而遠之。但是,這樣真的就可以保持神祕嗎?答案恐怕不是那麼樂觀,一旦有了社群網路,你可以逃,但是終將無處可躲。
近日發表在 PLOS ONE 的一篇學術論文,「社群網路上,一加一等於三」(One Plus One Makes Three (for Social Networks)
),德國的學者發現,他們可以利用社群網路上會員所分享的資料,來了解非會員之間的關係,例如他們是否彼此認識等等。
也就是說,即使有人因為不想洩漏隱私而拒絕使用臉書,最終也將由於他的朋友的活動,而讓這個「非使用者」的社群關係被預測出來。
這群研究人員,使用的都是屬於「公開」的資料,而社群網站的經營者可以使用的資料更多,包括性別、年齡、教育程度等等,如此能夠做出的預測,恐怕就不只是「誰認識誰」而已了。
這樣的研究結果,提醒了我們必須重新去思考,在這個資訊時代,我們必須更嚴肅的看待「關係」這種資料的所有權以及可能的濫用(譯按:真的是很德國的想法 XD)。
Labels:
data analytics,
tech,
translation
2012/11/11
[摘譯] 人工智能正在改變我們的生活
作者:Gregory M. Lamb; Carolyn Abate
譯按:「智慧型xx」近年來大行其道,這篇文章介紹了這個趨勢背後的人工智慧研究。筆者過去也有幾篇相關的討論,見「情境感知(Context Awareness)與智慧裝置」與「Smartizatin」。
[摘譯]
人工智能(artificial intelligence, AI)對我們生活的改變通常是以潛在無形,看不見、摸不到的方式在進行。很多「智慧化」的應用,已經透過手機、汽車、搜尋引擎等工具悄悄的融入我們的生活之中,無所不在。
傳統 AI 的里程碑,是要建造出能通過 Turing 測試(Turing test):能讓人分辨不出是電腦還是真人的對話系統。然而這個目標一直難以達成,也因此人工智能領域的研究焦點,逐漸由「模仿人類思考歷程」,轉移到比較具體實用的應用,例如救災機器人、語音辨識,和無人自動駕駛車等等。時至今日,iPhone 的應用程式 siri,除了作為語音辨識系統之外,還能掌握人與手機之間的非正式互動;具有跟人類駕駛一樣思考與反應能力的自動駕駛車,也已經在進行上路的測試。
麻省理工學院(Massachusetts Institute of Technology)的教授 Patrick Winston 表示,他們的長期目標是結合基於巨量資料的人工智能與傳統漸進式的方法,來創造可以實際進行思考的人工智能。
From "How Artificial Intelligence Is Changing Our Lives"
Christian Science Monitor (09/17/12) Vol. 104, No. 43, P. 26 Gregory M. Lamb; Carolyn Abate
View Full Article
Labels:
tech,
translation
2012/10/15
[摘譯] 人類記憶的終極指南
原文:The ultimate guide to memory - New Scientist
我們是記憶的集合。記憶限制了我們如何思考,如何行動與決策,甚至,定義了我們是誰。
然而,記憶的諸多優點與瑕疵,幾個世紀以來,對人類而言都是個巨大的謎團。記憶如何形成?在大腦裡如何儲存?為什麼我們記得某些事情,卻不記得另一些事件?我們應該如何善用、增強這個演化而來的工具?
在以下的文章中,我們試著回答上面些問題,以及其他許許多多關於記憶的疑惑。讓我們由「為什麼會有記憶」這件事的革命性看法開始。
譯按:這期 New Scientists 的封面專題,只翻譯了引言,以上連結皆為原文。
我們是記憶的集合。記憶限制了我們如何思考,如何行動與決策,甚至,定義了我們是誰。
然而,記憶的諸多優點與瑕疵,幾個世紀以來,對人類而言都是個巨大的謎團。記憶如何形成?在大腦裡如何儲存?為什麼我們記得某些事情,卻不記得另一些事件?我們應該如何善用、增強這個演化而來的工具?
在以下的文章中,我們試著回答上面些問題,以及其他許許多多關於記憶的疑惑。讓我們由「為什麼會有記憶」這件事的革命性看法開始。
簡介 | |
記憶:為了接下來要發生的事情記憶的目的,其實是為了要對未來做出預測,而非對過去保存記錄。 | |
比較心理學 | |
動物會遺忘嗎?從記得人臉的鴿子,到會囤積石塊攻擊人類的猩猩,所有的動物都有記憶。這些記憶能力,跟人類有什麼不同嗎? | |
自傳式記憶 | |
記憶如何杜撰我們的生活故事自傳是生活中許多事件的集合,而我們的記憶決定了哪些片段該被選進這個專輯之中。 | |
心理健康 | |
堅強你的精神堡壘與我們的過去連結,可以幫助我們抵抗憂鬱或重大創傷後壓力症候群,而這個發現帶來了新的心理治療方法。 | |
健忘 | |
迷失在此時此刻健忘的人表現出身體與記憶間的奇特互動。 | |
增強記憶 | |
六式絕藝讓你成為記憶大師想要憑著意志去選擇記得或遺忘嗎?這裡有六招不傳之祕。 |
譯按:這期 New Scientists 的封面專題,只翻譯了引言,以上連結皆為原文。
Labels:
tech,
translation
2012/10/11
[Data Analytics] 打造資料科學團隊
Big Data 的話題正炒得熱火朝天,好像每間公司都要有自己的資料科學團隊一般。但是要如何打造這樣的團隊,如何讓資料科學團隊直接對企業的獲利做出貢獻?
DJ Patil 在 O'Reilly Radar 出版的報告 Building data science teams 當中,以 Facebook 和 LinkedIn 組建資料與分析團隊的經驗分享為主軸,討論了企業如何轉型成「資料驅動」(data-driven),相關的產品與服務設計,以及資料科學家在這個過程當中扮演的角色。
Patil 提出「資料科學」在企業當中的功能,可以分為幾類:
如果說 Patil 的文章,講的是從實務經驗當中去定義出「資料科學」,Nicole Laskowski 的這篇
Interviewing data scientist candidates? Ask these questions 就比較像是想成為資料科學家的人,或是想建立資料科學團隊的企業主管的面試教戰手冊。這篇文章訪問了SAS的分析長 Bill Franks,討論了他甄選資料科學家的一些條件。
最後,附上一段 DJ Patil 的訪談,有趣的是一些資深業界人士認為最適合這項工作的教育背景其實不是資訊科技,而是天文、氣象學這類每天在浩瀚資料裡游泳的物理學專才。不過既然人際的 softskill 也是資料科學家必備的能力,那麼 The Big Bang Theory 裡的 Sheldon Cooper 大概就不太適合這個工作了,Bazinga! XD
DJ Patil 在 O'Reilly Radar 出版的報告 Building data science teams 當中,以 Facebook 和 LinkedIn 組建資料與分析團隊的經驗分享為主軸,討論了企業如何轉型成「資料驅動」(data-driven),相關的產品與服務設計,以及資料科學家在這個過程當中扮演的角色。
Patil 提出「資料科學」在企業當中的功能,可以分為幾類:
- 決策科學與商務智慧
- 產品與行銷分析
- 風險管理與安全性(偵測詐騙及濫用)
- 資料服務與日常營運的輔助
- 資料工程與資訊架構
- 組織架構與報表的同步
如果說 Patil 的文章,講的是從實務經驗當中去定義出「資料科學」,Nicole Laskowski 的這篇
Interviewing data scientist candidates? Ask these questions 就比較像是想成為資料科學家的人,或是想建立資料科學團隊的企業主管的面試教戰手冊。這篇文章訪問了SAS的分析長 Bill Franks,討論了他甄選資料科學家的一些條件。
最後,附上一段 DJ Patil 的訪談,有趣的是一些資深業界人士認為最適合這項工作的教育背景其實不是資訊科技,而是天文、氣象學這類每天在浩瀚資料裡游泳的物理學專才。不過既然人際的 softskill 也是資料科學家必備的能力,那麼 The Big Bang Theory 裡的 Sheldon Cooper 大概就不太適合這個工作了,Bazinga! XD
Labels:
data analytics
2012/10/02
[Data Analytics] Data Analytics Boot Camp
日前參加了 The Modeling Agency 舉辦的 Data Analytics Boot Camp,算是一個小型的 workshop,由資深的 Data Analytics Consultant 主持,除了主講者本身的經驗談之外,也讓各行各業使用 Data Mining 的參與者一起分享彼此的經驗。
之前報名舊金山的場次因故無法成行,這次改參加 Washington DC 的場次,主持人 Tony Rathburn 算是業界小有名氣的資深顧問與講師,在 Data Mining Research 上有關於他的訪談。
Tony Rathburn 其實是他撰寫部落格的「藝名」,在兩天的座談裡,Tony 分享了他二十多年來做為資訊系統與資料探勘顧問的一些心得,以及在各個行業裡要應用這種工具所需要注意的要點。從大學教授轉戰業界,Tony 的見解相當獨到,而對於他沒有經歷過的領域(就是小弟向他請益的部份),所提出的建議也非常實用。
兩天的討論內容,當然不太可能短短的篇幅裡道盡細節,不過有幾個個人覺得蠻重要的觀念,倒是可以先摘要出來,以後再慢慢細述。
這些觀念都伴隨著許許多多的實例討論,包括來自 JP Morgan Chase 的毛先生分享金融商品交易的技術。
因為這次舉行的地點是在美國首都,所以有一半的與會成員是美國人事行政局的員工,包含資訊與專案規劃的人員,他們對於每年哪些公務員會退休的預測有很大的興趣,因為這會牽涉到整個人事行政策略的全盤規劃。年底還有一次在 Las Vegas 舉辦的座談會,不知道會不會有賭場的代表參加呢?我個人倒是對這個蠻有興趣的。
總之,覺得參加這個座談會的收穫頗為豐富,只是為了這個要跑一趟美國實在有點累,只好等下次有長假時再看看有沒有機會了。
之前報名舊金山的場次因故無法成行,這次改參加 Washington DC 的場次,主持人 Tony Rathburn 算是業界小有名氣的資深顧問與講師,在 Data Mining Research 上有關於他的訪談。
Tony Rathburn 其實是他撰寫部落格的「藝名」,在兩天的座談裡,Tony 分享了他二十多年來做為資訊系統與資料探勘顧問的一些心得,以及在各個行業裡要應用這種工具所需要注意的要點。從大學教授轉戰業界,Tony 的見解相當獨到,而對於他沒有經歷過的領域(就是小弟向他請益的部份),所提出的建議也非常實用。
兩天的討論內容,當然不太可能短短的篇幅裡道盡細節,不過有幾個個人覺得蠻重要的觀念,倒是可以先摘要出來,以後再慢慢細述。
- Data Analytics 的作用,是利用收集到的資料以及設計出的分析工具,來針對決策做出輔助,真正的目的在於「提高決策的效益」。
- Data Analytics 專案的重點,會在於對整個決策歷程、所涉及的商業模式以及績效指標的理解,使用的分析與資料工具反而是次要的。
- 善用對專案所欲解決問題的理解,盡可能的把解決方案設計成直接與績效指標相關的 binary classification,退而求其次是 multi-label classification,真的萬不得已才使用回歸預報的方式。(個人過去的專案經驗當中對此也有深深的同感,Tony 的說法是「因為我懶惰」,但是實則有更深刻的數學理由,有機會以後再討論)
- 區分 Big Data 和 Fat Data 的不同:對於大多數的現實問題,Big Data 只能提高準確率(而且很有限),Fat Data 才能針對問題找出更多的洞見。(之前摘錄的一篇「大資料與小資料」中的引文也有探討類似的問題)
這些觀念都伴隨著許許多多的實例討論,包括來自 JP Morgan Chase 的毛先生分享金融商品交易的技術。
因為這次舉行的地點是在美國首都,所以有一半的與會成員是美國人事行政局的員工,包含資訊與專案規劃的人員,他們對於每年哪些公務員會退休的預測有很大的興趣,因為這會牽涉到整個人事行政策略的全盤規劃。年底還有一次在 Las Vegas 舉辦的座談會,不知道會不會有賭場的代表參加呢?我個人倒是對這個蠻有興趣的。
總之,覺得參加這個座談會的收穫頗為豐富,只是為了這個要跑一趟美國實在有點累,只好等下次有長假時再看看有沒有機會了。
Labels:
data analytics,
life
2012/09/18
完成階段性任務的 Conversation Network
最近收到通知,長期以來收聽的 podcast 頻道 Conversation Network 宣布「已完成階段性任務」,將要「發生一些重大改變」。摘要如下:
- 專門討論社會議題的 Social Innovations Conversations 將會在 Stanford Graduate School of Business 的 Center for Social Innovation 繼續進行,過往的播出都會整合到此網站。
- 專門討論人機介面的 CHI Conversations 將會回歸到原本的發行地: BayCHI web site。
- 資訊產業的相關討論 IT Conversations,將在 12月 1日停播。
- 眾多podcast 的集散地 SpokenWord.org 也將在 12月 1號關站。
我自己大約是 2005~06 年開始收聽 IT Conversation,根據資料是「歷史上第二個 podcast,過去十年發行超過 3,300 個節目」。當年是因為找某個研討會的演講找到的,後來發現內容羅萬象,當中最喜歡的是收錄 Dr. Moira Gunn 主持的 Tech Nation(舊金山地區的廣播節目),常常訪問新書作者跟新產業的創業家,算是讓我受益良多的節目。
訂戶通知裡沒有說明為什麼 Conversation Network 將要熄燈暫停,當然其收錄的節目內容也都會各自持續下去,不過這個頻道對我個人而言,也真的是一段值得記錄的里程碑了。
2012/09/01
[Data Analytics] 如何成為一名資料科學家?
前面簡短的介紹過了「資料科學」跟「資料科學家」,那麼要作為一位「資料科學家」,應該具備怎樣的技能或特質呢?
Gary Ernest Davis 在他的 So you want to be a data scientist? 一文中,以幾位目前比較有知名度的 Big Data 專家為例(Hilary Mason,Guy LeMar,Monica Rigati),列舉了要成為資料科學家所必須具備的技能。
Gary Ernest Davis 在他的 So you want to be a data scientist? 一文中,以幾位目前比較有知名度的 Big Data 專家為例(Hilary Mason,Guy LeMar,Monica Rigati),列舉了要成為資料科學家所必須具備的技能。
首先,要能夠快速的操作與搬弄大量的資料,所以至少要會一種 scripting language (Perl,Python,或是新的 Julia language)。然後,要熟悉命令列的操作,Unix 環境與基本指令,並且會用各種 APIs。
作為資料分析的核心技術,對統計方法的深入理解也是必要的,像是探索式的資料分析(exploratory data analysis),各種回歸分析(regression,或是 loess regression)基礎的實驗設計(design an experiment)以及假設檢定(test a hypothesis)。作為統計學知識的一部份,在 R 或是 Python pandas 上流利的操作也是必須的,瞭解資料視覺化(data visualization)並且能夠設計並且測試演算法(design and test algorithms)在資料探勘(data mining)與機器學習(machine learning)上有充分的知識。而資料庫的程式撰寫,像是各種 SQL 的版本,也是必備的技能。
此外還有加分的技能,像是對各種問題的數值模擬(simulation), 解決方案 scale up 會用到的 Hadoop 和 Map Reduce,以及高效電腦叢集(High Performance Computer Cluster)的管理,會是資料逐漸走向巨量化的趨勢下,相當吃香的本事。最後,資料科學需要跟其他的 domain expert 合作,因此良好的溝通表達能力是相當重要的。
Charles Roe 在另一篇名字很相似的文章,So you want to be a Data Scientist? 當中,則是列舉了十一個資料科學家應該熟悉的領域:數學,統計分析,程式語言(Programming/Scripting Languages),關聯式資料庫,分散式計算以及相關工具(Distributed Computing Systems and Tools),資料探勘,資料模擬(Data Modeling),視覺化,創意與創新(Creativity and Innovation),溝通與商業頭腦(Communication and Business Perspicacity),以及教育。基本上跟前面的清單差異不大。
簡單的說,就是要有相當的程式設計功力,純熟的資訊系統操作技術,量化分析的本領,加上良好的溝通表達能力。這看起來似乎也不是目前某個單一學門可以訓練出來的特質,另外還有一些「如何組成資料科學團隊」的參考,就留待下一篇再說好了。
簡單的說,就是要有相當的程式設計功力,純熟的資訊系統操作技術,量化分析的本領,加上良好的溝通表達能力。這看起來似乎也不是目前某個單一學門可以訓練出來的特質,另外還有一些「如何組成資料科學團隊」的參考,就留待下一篇再說好了。
Labels:
data analytics,
tech
2012/08/27
[Data Analytics] 資料科學家
前面簡短的介紹過了「資料科學」,相對應的就應該有「資料科學家」這樣的角色,我們可以看看一些資深業界人士的看法:
- 資料科學家是「數位趨勢觀察家」與「把散落的資訊整合成動人故事的說書人」的合體。這些專家或團隊拿著篩子濾過巨量的資料,並且從當中尋找新發現。-Anjul Bhambhri,IBM 巨量資料產品部門副總裁.
- 資料科學家擁有獨特的技能組合,能從資料本身當中釋放出洞見,同時並能用資料說出動人的故事。 -Dr. DJ Patil,現任 Greylock Partners 資料科學家,前任 LinkedIn Corporation 的首席科學家、首席安全官,以及資料與分析團隊主持人。
- 資料科學家是罕見的混合型人才,他必須是電腦科學家,能夠撰寫程式、開發工具,來挖掘、整合以及管理多元來源的資料;他也必須是統計學家,知道如何從資訊之中提煉洞見;他必須同時具備創意與嚴謹,綜合多種技能開發出新的原型工具,來探索各種資料背後深刻的意義。-Jake Porway, Data without Borders and New York Times.
- 資料科學家是「具有分析思維,對統計與數學有深刻理解的資料工程師,他們可以從大量的資料當中探索商業或其他複雜系統當中的洞見」-Steve Hillion, EMC Greenplum 分析部門副總裁
2012/08/24
[摘譯] 相變材質帶來新的建材
原文:Game changer? Phase-change products boost building performance | SmartPlanet
西班牙馬德里的 Polytechnic 大學開發了一種石蠟隔板,透過石蠟粒子「白天吸熱,晚上放熱」的特性,可以讓建築物的能源使用下降 40%。
除了塗料之外,相變材質也可以用噴劑的方式存在。2011 年,University of Nottingham 在中國寧波的分校,也開發出特殊的熱調節材料,混合在建築塗料中應用。
PCM 建材的作用,主要都是透過「延後導熱」或「選擇性導熱」這樣的特性,讓建築本身在環境溫度變化到某個程度時,可以在環境中展現不同的熱屬性,達到溫度調節的效果。
雖然相變材料還是很新的主題,但是其實市場上已經存在很多選擇,像是 RavenBrick 就有提供磚頭、窗戶、塗料等等。這些材料也衍生出更多進階的應用,例如 MIT 的智慧型屋頂。
除了建材之外,相變材質其實也咬就大量應用在保溫、加熱的小家電,以及各種行動裝置上,不過這些小面積的應用對環境溫度的調節沒有明顯的效果就是了。
譯按:相變材質(Phase-change materials, PCMs)主要是利用物質在發生相位變化(凝結/氣化、凝固/融解....等等)時所伴隨的潛熱(latent heat)吸收或釋放,來作為特定的功能。一般來說,會選擇在特定溫度(例如室溫)發生相變(例如固態與液態之間的轉變),而潛熱量大的物質。例如乙酸納製的暖暖包,就是一種相變材質的應用。相變材質可透過潛熱的吸收與釋放來調節周遭的溫度,這種材料在建築上的應用有不斷加速的趨勢。
西班牙馬德里的 Polytechnic 大學開發了一種石蠟隔板,透過石蠟粒子「白天吸熱,晚上放熱」的特性,可以讓建築物的能源使用下降 40%。
除了塗料之外,相變材質也可以用噴劑的方式存在。2011 年,University of Nottingham 在中國寧波的分校,也開發出特殊的熱調節材料,混合在建築塗料中應用。
PCM 建材的作用,主要都是透過「延後導熱」或「選擇性導熱」這樣的特性,讓建築本身在環境溫度變化到某個程度時,可以在環境中展現不同的熱屬性,達到溫度調節的效果。
雖然相變材料還是很新的主題,但是其實市場上已經存在很多選擇,像是 RavenBrick 就有提供磚頭、窗戶、塗料等等。這些材料也衍生出更多進階的應用,例如 MIT 的智慧型屋頂。
除了建材之外,相變材質其實也咬就大量應用在保溫、加熱的小家電,以及各種行動裝置上,不過這些小面積的應用對環境溫度的調節沒有明顯的效果就是了。
2012/08/13
[Data Analytics] 氣候資料探勘
氣候研究領域一直有「遙相關」(telecorrelation)的研究,主要是透過分析長期資料,找出氣象參數高度相關的地點,然後嘗試從物理的觀點來詮釋這個現象。Kumar 將資料探勘當中的 Association Rule Learning 與遙相關的研究傳統結合,進而發展出一系列新的演算法,適用於「時空分布」性質的資料,大幅拓展了 association analysis 的適用範圍。
此外,Kumar 也將氣候資料與生態資料合併分析,建立了時空分布資料變化的自動偵測系統,而這個系統後來被應用在衛星監測的技術上,觀測地球表面生態系統的變化。
Kumar 教授是大型前瞻計畫 Understand Climate Change: a data-driven approach 與 GOPHER: Global Observation for Planetary Health and Resources 的主持人,這也算是 Big Data 趨勢當中的新資料型態的應用。不過 NoSQL 應當是另一個主題,之後再專文討論吧。
Labels:
data analytics,
tech
2012/08/09
從 MVC 到 MOVE
三層架構的 MVC (Model-View-Controller,中文介紹) 模式,大概是目前軟體工程最廣為人知的基本架構,尤其是在網路服務成為資訊系統的主流之後,J2EE ,Windows Forms,Perl,Ruby on Rails 等等,都對此架構有相當好的定義與支援。
日前,一位 LinkedIn 的工程師 Conrad Irwin 基於工作中使用 MVC 架構遇到的困難,提出了 MOVE (Model-Operation-View-Event,中文介紹) 架構。MOVE 並不是全新的架構,而是把原本的 Controller 再區分成 Operation 與 Event,以期更能適應現在新的程式開發環境。
在 MVC 架構提出的時候,應用程式的各個元件大多是在同一台主機上執行,但是隨著時代的改變,分散式運算以及非同步更新逐漸普及, MOVE 在這些新的運算環境下或許真的是個不錯的架構。
日前,一位 LinkedIn 的工程師 Conrad Irwin 基於工作中使用 MVC 架構遇到的困難,提出了 MOVE (Model-Operation-View-Event,中文介紹) 架構。MOVE 並不是全新的架構,而是把原本的 Controller 再區分成 Operation 與 Event,以期更能適應現在新的程式開發環境。
在 MVC 架構提出的時候,應用程式的各個元件大多是在同一台主機上執行,但是隨著時代的改變,分散式運算以及非同步更新逐漸普及, MOVE 在這些新的運算環境下或許真的是個不錯的架構。
Labels:
tech
2012/08/05
[Data Analytics] 資料科學 Data Science
什麼是「資料科學」(Data Science)?
根據 Christian Langreiter 有點酸的 twitter 留言,「所謂的資料科學家,指的是居住在加州某個地區,或是在 bitly 上班的統計學家」。言下之意,資料科學只不過是統計學的新包裝罷了。
今年六月,O'Reilly Media 的副總裁 Mike Loukides 日前發表了一本小書:what is data science? ,倒是為這個問題做了比較正式的回答。
書中從目前常見的 data-driven services 開始切入,分別從「資料哪裡來?」、「與大量的資料共舞」、「讓資料說故事」,以及「資料科學家」四個主題,來介紹資料科學。
有興趣的讀者可以參考原文,當中介紹了相當多的應用實例以及工具。簡單的來說,目前的資料科學,相較於傳統的統計學,在資料來源、分析處理方式、視覺呈現,以及從事這項工作所需具備的技能上都有些許的差別。
資料科學在文中被喻為是「未來的 Intel inside」,而能夠「獲取資料,理解資料,處理資料,從當中萃取價值,將之視覺化,並用來與人跟溝通」的能力,則會是未來十年產業急切需要的。
不知道除了文中介紹的幾個國際大廠之外,其他的科技業者準備好了嗎?
根據 Christian Langreiter 有點酸的 twitter 留言,「所謂的資料科學家,指的是居住在加州某個地區,或是在 bitly 上班的統計學家」。言下之意,資料科學只不過是統計學的新包裝罷了。
今年六月,O'Reilly Media 的副總裁 Mike Loukides 日前發表了一本小書:what is data science? ,倒是為這個問題做了比較正式的回答。
書中從目前常見的 data-driven services 開始切入,分別從「資料哪裡來?」、「與大量的資料共舞」、「讓資料說故事」,以及「資料科學家」四個主題,來介紹資料科學。
有興趣的讀者可以參考原文,當中介紹了相當多的應用實例以及工具。簡單的來說,目前的資料科學,相較於傳統的統計學,在資料來源、分析處理方式、視覺呈現,以及從事這項工作所需具備的技能上都有些許的差別。
資料科學在文中被喻為是「未來的 Intel inside」,而能夠「獲取資料,理解資料,處理資料,從當中萃取價值,將之視覺化,並用來與人跟溝通」的能力,則會是未來十年產業急切需要的。
不知道除了文中介紹的幾個國際大廠之外,其他的科技業者準備好了嗎?
Labels:
data analytics,
tech,
thoughts
2012/07/26
[摘譯] 過去200年,改變世界的關鍵時刻
2012年,全世界大多數的人居住在大都市裡,每年有3000多 萬次的航班在天空中翱翔, 每天到消費者手上的智慧型手機與平板電腦, 數量超過了每天誕生的新生兒。
回首過去兩百年,世界被一連串彼此有關或無關的事件所改變, 這些突破、創造、發現、創新、革命,以及人類成就的歷史時刻, 構成了人類的歷史,並且形塑了我們今日的生活。
Labels:
news,
translation
2012/07/22
[摘譯] 行動學習帶來的十種教育革命
原文:10 Ways That Mobile Learning Will Revolutionize Education
作者:Fabio Sergio
出處:Co.Design: business + innovation + design
智慧型手機以及平板電腦的出現,改變了人類攝取以及分享知識的方式:我們無時無刻的與幾近無限大的知識庫保持著連結的關係。我們可以不用預約就輕易的諮詢各種專家,從非正式的廚藝教學,到大學的專業課程,都只有一觸之遙。每一天,全世界的人們都因著各種新的學習型態而興奮不已,而傳統的教育系統,卻還掙扎在如何利用這些創新來改善自身運作的狀況。
行動通訊裝置已經對人們的學習方式帶來很大的改變,進而使人們對於「學習」的需求也發生了變化。教育產業必須對這些變化有所體認,才不會失去對市場的掌握。
目前教育市場的消費者大致可以分為三類:牙牙學語的幼兒們,觸控螢幕跟紙本書對他們來說是一樣的熟悉與舒適;大學階段的年輕人,已經開始質疑「校園」存在的必要性;已經出社會的專業工作者,希望能繼續精進自己的專業技能,以在惡劣的經濟環境下持續保持優勢。
我們以「行動學習」與「自我學習」(mLearning)為焦點,針對成熟市場以及開發中地區,配合 frogMob 以及世界經濟論壇(World Economic Forum)的研究資料,找出十個行動學習會帶來的教育變革。
1. 持續的進修
傳統的教育模式,指的是在某個教育機構裡註冊,並且在修業年限裡學習,因此大多發生在特定的年齡層與特定地理區域。隨著行動裝置的普及,有越來越多的人選擇了「線上課程」作為進修的途徑,除了年齡層與地域不再受限,進修的主題也更深化到進階的主題,像是「人工智慧」與「博奕理論」等等。
2. 發展中地區教育的蛙跳式發展
持續進修的現象不只發生在已開發國家,發展中地區由於低價的電腦、手機與平板電腦的導入,科技上產生了跳蛙式發展(leapfrogging),也為居民帶來了新的教育機會。
3. 新的年長終身學習者
持續進修者當中有一個新族群:60歲以上的老年人。這些退休者為了與孫子、孫女相處,而開始使用平板電腦,以及電子郵件、社群網路,和視訊通訊等等軟體。
這些已退休的人士,事實上也是相當適合的師資來源。
4. 破除性別藩籬,減少身體負擔
由於行動學習突破了特定地域與特定時間的限制,一些原本無法接受教育的族群,例如某些特定區域的女性,或是行動不便的人士,也重新獲得了受教育的機會。
5. 新的識字能力:軟體
「行動學習」的運作,大量的倚賴電腦軟體,也因此操作軟體以及撰寫程式語言,成了新的基本能力。
6. 教育長尾
當前行動學習的主流是透過影音分享網站來傳遞高等教育的教學影片,但是除此之外仍有長尾的利基市場。例如,Salman Khan 的 Khan Academy,人道組織 MAMA 的簡訊教學等等。
7. 施教與受教者的角色交換
越來越多的學童從小熟悉電腦的操作,並具備影音編輯的能力,這些人會為他們的同儕、甚至師長製作各種教學的影片,從受教者搖身一變成為施教者。
8. 與行動金融、行動健康產生綜效
行動金融與行動醫療比行動教育的起步稍早,也因此有不少參考的價值,而三者的整合更能產生促進經濟發展的綜效。
9. 傳統教育機構的新機會
行動學習雖然不必然發生在傳統的教育機構,但卻可以作為傳統教育方式的補充與延伸。
10. 客製化的教育帶動變革
行動學習的成功,不在於將現有的教育內容數位化與行動化,而在於可以讓使用者自己選擇教育的內容,或是依據使用者的性向與能力提出適當的規劃。
作者:Fabio Sergio
出處:Co.Design: business + innovation + design
智慧型手機以及平板電腦的出現,改變了人類攝取以及分享知識的方式:我們無時無刻的與幾近無限大的知識庫保持著連結的關係。我們可以不用預約就輕易的諮詢各種專家,從非正式的廚藝教學,到大學的專業課程,都只有一觸之遙。每一天,全世界的人們都因著各種新的學習型態而興奮不已,而傳統的教育系統,卻還掙扎在如何利用這些創新來改善自身運作的狀況。
行動通訊裝置已經對人們的學習方式帶來很大的改變,進而使人們對於「學習」的需求也發生了變化。教育產業必須對這些變化有所體認,才不會失去對市場的掌握。
目前教育市場的消費者大致可以分為三類:牙牙學語的幼兒們,觸控螢幕跟紙本書對他們來說是一樣的熟悉與舒適;大學階段的年輕人,已經開始質疑「校園」存在的必要性;已經出社會的專業工作者,希望能繼續精進自己的專業技能,以在惡劣的經濟環境下持續保持優勢。
我們以「行動學習」與「自我學習」(mLearning)為焦點,針對成熟市場以及開發中地區,配合 frogMob 以及世界經濟論壇(World Economic Forum)的研究資料,找出十個行動學習會帶來的教育變革。
1. 持續的進修
傳統的教育模式,指的是在某個教育機構裡註冊,並且在修業年限裡學習,因此大多發生在特定的年齡層與特定地理區域。隨著行動裝置的普及,有越來越多的人選擇了「線上課程」作為進修的途徑,除了年齡層與地域不再受限,進修的主題也更深化到進階的主題,像是「人工智慧」與「博奕理論」等等。
2. 發展中地區教育的蛙跳式發展
持續進修的現象不只發生在已開發國家,發展中地區由於低價的電腦、手機與平板電腦的導入,科技上產生了跳蛙式發展(leapfrogging),也為居民帶來了新的教育機會。
3. 新的年長終身學習者
持續進修者當中有一個新族群:60歲以上的老年人。這些退休者為了與孫子、孫女相處,而開始使用平板電腦,以及電子郵件、社群網路,和視訊通訊等等軟體。
這些已退休的人士,事實上也是相當適合的師資來源。
4. 破除性別藩籬,減少身體負擔
由於行動學習突破了特定地域與特定時間的限制,一些原本無法接受教育的族群,例如某些特定區域的女性,或是行動不便的人士,也重新獲得了受教育的機會。
5. 新的識字能力:軟體
「行動學習」的運作,大量的倚賴電腦軟體,也因此操作軟體以及撰寫程式語言,成了新的基本能力。
6. 教育長尾
當前行動學習的主流是透過影音分享網站來傳遞高等教育的教學影片,但是除此之外仍有長尾的利基市場。例如,Salman Khan 的 Khan Academy,人道組織 MAMA 的簡訊教學等等。
7. 施教與受教者的角色交換
越來越多的學童從小熟悉電腦的操作,並具備影音編輯的能力,這些人會為他們的同儕、甚至師長製作各種教學的影片,從受教者搖身一變成為施教者。
8. 與行動金融、行動健康產生綜效
行動金融與行動醫療比行動教育的起步稍早,也因此有不少參考的價值,而三者的整合更能產生促進經濟發展的綜效。
9. 傳統教育機構的新機會
行動學習雖然不必然發生在傳統的教育機構,但卻可以作為傳統教育方式的補充與延伸。
10. 客製化的教育帶動變革
行動學習的成功,不在於將現有的教育內容數位化與行動化,而在於可以讓使用者自己選擇教育的內容,或是依據使用者的性向與能力提出適當的規劃。
Labels:
innovation,
tech,
translation
2012/07/17
情境感知(Context Awareness)與智慧裝置
情境感知(Context Awareness)其實不是什麼最新的技術,而比較像是一種概念:結合裝置上各種的感應器以及已有的資訊(例如行事曆、通訊錄),可以預測使用者的意圖,並且預先提供適當的反應。
這個想法,主要是 Intel 在 2010 年的開發者論壇上所提出,並且有一整套的使用情境,並預計未來會提出完整的開發工具。詳細的內容可以參考:Context Awareness to Radically Change How We Interact with Technology。
Context aware computing 是讓各種計算裝置表現得有「智慧」的基礎,其實在 Apple 或 Samsung 近期訴求的各種軟體服務當中已經可以看到一些端倪。依據 Intel 的說法,這樣的概念會是使用者經驗設計的技術基礎,而背後的核心技術其實和 Big Data 相似:最佳化與機器學習。
當然,一種概念的實作,同時需要使用情境的設計與工程技術的調校,倒不是光憑創意或是光靠技術能力就可以達成的。所以 Intel 能提供的也只是基本工具和設計指南,真正要落實到裝置的設計上,還是有賴系統整合商本身的努力。
這個想法,主要是 Intel 在 2010 年的開發者論壇上所提出,並且有一整套的使用情境,並預計未來會提出完整的開發工具。詳細的內容可以參考:Context Awareness to Radically Change How We Interact with Technology。
Context aware computing 是讓各種計算裝置表現得有「智慧」的基礎,其實在 Apple 或 Samsung 近期訴求的各種軟體服務當中已經可以看到一些端倪。依據 Intel 的說法,這樣的概念會是使用者經驗設計的技術基礎,而背後的核心技術其實和 Big Data 相似:最佳化與機器學習。
當然,一種概念的實作,同時需要使用情境的設計與工程技術的調校,倒不是光憑創意或是光靠技術能力就可以達成的。所以 Intel 能提供的也只是基本工具和設計指南,真正要落實到裝置的設計上,還是有賴系統整合商本身的努力。
2012/07/10
[摘譯][Data Analytics] 從「軟體」公司到「資料」公司
軟體公司已死。
販售軟體,聽起來已經像是上個世紀的事情,現在資金都是湧向資料與雲端的服務供應商。
去年(2011)的 Strata Conference 上,一些「軟體公司」很高興的幫自己「正名」為資料公司,Pervasive Software 的技術長 Mike Hoskins 就表示:「Google 跟 Facebook 是軟體公司嗎?並不是的,這些公司提供給市場的,是管理與分析資料的能力。」
RedMonk 的 Stephen O'Grady 也在去年的一場演講中說到:全球前二十名的軟體公司,在 Fortune 500 中的排名是偏低的,當中更沒有任何一家擠進 Fortune 的 top 10。這告訴我們,如果要經營一家軟體公司,最好準備花十年以上的時間來經營與慢慢壯大,....然而,資料是比軟體更好的獲利管道,歡迎來到資料的時代。
對於創業者,Hongwei Zhu 與 Stuart E. Madnick 也建議了一些資料的創新用法:
- 販賣「私有」資料:特殊、專門的資料庫,通常經爭者較少,而利潤較高。
- 資料「再利用」:整合多種資料來源。
- 差異化:以特殊創新的方式重新包裝與利用資料,例如簡化資料的使用流程。
- 分析:利用整合性資料的分析,為日常與策略性決策提供輔助。
Labels:
data analytics,
tech,
translation
2012/07/07
[Data Analytics] 用社群網站的活動資訊預測人的性格
無論是占星、血型、八字、紫微斗數,或是性格型態,都屬於把人「分類」的方式,也都各有其傳統與理論。姑且不論一些歷史悠久的命理學派,就以研究人類性格的心理學領域來說,事實上也是資料分析的應用:利用數學模型,把觀察到的人類行為特徵區分成不同的群組。
而將人分群或分類的好處,當然是在於更精確的「預測」。比方說,一般的命理諮詢,就常常會被問到類似「什麼星座的人應該怎樣跟他相處」這樣的問題,表示我們期望能透過適當的分類,而對某個族群的人的行為有更精確的預測。而這種預測,對於行銷來說就有相當的商業價值。
然而,星座、血型屬於個人隱私,心理學的性格分類需要回答比較冗長的問卷,這些都不是一般情況下容易取得的資訊。幸而,目前社群網站流行,不少人每天不發表一下自己的感受就渾身不對勁,這些公開自我揭露的資訊,就變成了另一個將人分群的依據。
今年以來,陸續有心理學家透過分析社群網站上的活動型態,來預測一個人是否出現憂鬱症的症兆,或是預測人格的類型,至於其他的商業活動,其實早就應用在各種網路行銷手法當中。
前一陣子用業餘時間參加了兩個以 twitter 發文特徵來預測性格(反社會傾向與人格特質)的活動,舉辦比賽的單位提供收集到的 twitter 資料以及該使用者的各種人格指標,讓參賽者各自用喜好統計模型來做預測。主辦單位的目的,是希望藉此活動建立一些「使用網路的安全準則」,讓一般消費者可以避免在使用網路的時候,不經意的透露太多個人隱私。
而將人分群或分類的好處,當然是在於更精確的「預測」。比方說,一般的命理諮詢,就常常會被問到類似「什麼星座的人應該怎樣跟他相處」這樣的問題,表示我們期望能透過適當的分類,而對某個族群的人的行為有更精確的預測。而這種預測,對於行銷來說就有相當的商業價值。
然而,星座、血型屬於個人隱私,心理學的性格分類需要回答比較冗長的問卷,這些都不是一般情況下容易取得的資訊。幸而,目前社群網站流行,不少人每天不發表一下自己的感受就渾身不對勁,這些公開自我揭露的資訊,就變成了另一個將人分群的依據。
今年以來,陸續有心理學家透過分析社群網站上的活動型態,來預測一個人是否出現憂鬱症的症兆,或是預測人格的類型,至於其他的商業活動,其實早就應用在各種網路行銷手法當中。
前一陣子用業餘時間參加了兩個以 twitter 發文特徵來預測性格(反社會傾向與人格特質)的活動,舉辦比賽的單位提供收集到的 twitter 資料以及該使用者的各種人格指標,讓參賽者各自用喜好統計模型來做預測。主辦單位的目的,是希望藉此活動建立一些「使用網路的安全準則」,讓一般消費者可以避免在使用網路的時候,不經意的透露太多個人隱私。
Labels:
data analytics,
funny,
tech
2012/07/02
[Data Analytics] 最遙遠的距離
這篇不是要談同名的電影,而是要講機器學習演算法裡的一個觀念:「距離」(distance metric),轉錯台的觀眾可以繼續轉台,謝謝。
之前的一篇文章「機器學習學些什麼」,談到以目的來說,機器學習演的算法可以區分為「分類」(classification)跟「分群」(clustering)兩大類。然而無論是分類或是分群,大多數的演算法都需要用到一個重要的概念:「距離」。
舉例來說,怎麼判斷兩個水果像不像,該不該當成同一類?我們可能會從大小、形狀、顏色或氣味等等特徵的相似與否來做綜合判斷,而這些評判的結果,就是所謂的「距離」。比方說,橘子跟柳丁的距離就比跟西瓜的距離來得近,也就是說:相似度(similarity)越高,距離(distance)就越近。
有的特徵差異是很具體、很容易了解的,例如地圖上的距離,年齡、身高、和體重的差異等等;但有些特徵的差異卻是很抽象而難以表達的,例如愛好食物的種類、職業、國籍,等等。究竟愛吃水果跟愛吃牛排的差異,是不是大於愛吃素跟愛吃雞排的差異?這實在很難比較。
讓我們從實際的例子來看這件事:一個人的國籍是英國,他是跟法國人距離比較近呢,還是跟美國人比較近?從地圖上來看,英國應該是跟法國比較接近,但是從語言上來看卻是美國人跟英國比較相似。這又凸顯了「距離」的另一個問題:當衡量的標準不同的時候,距離也會跟著不同。
要克服這些「定義不明確」、「定義會改變」的狀況,目前比較通用的方式是「以果為因」,讓電腦從大量分類或分群好的資料裡去學習出距離的定義(learning distance metric from data),除了在實務上有效之外,在理論上也符合貝氏機率的觀點。
講了半天,好像還沒講到最遙遠的距離是什麼,這樣有點對不起這個標題。
傳統上,距離的定義是「對稱」的,也就是「我到你的距離」跟「你到我的距離」是一樣的。這在理解上非常容易,台北到高雄的距離,怎麼會跟高雄到台北的距離不同呢?但是近年來,這個限制受到了挑戰,甚至已經被從 metric 的必要條件裡移除了。
我們不妨用另一個例子來看這件事。假設今天吹南風,我坐飛機從台北到高雄需要的時間,跟坐飛機從高雄到台北的時間,是不會一樣的。所以如果我們要量測的「距離」是空中交通所需的時間,那麼自然是不會對稱的。
不對稱的距離,應該也算是種最遙遠的距離吧。
之前的一篇文章「機器學習學些什麼」,談到以目的來說,機器學習演的算法可以區分為「分類」(classification)跟「分群」(clustering)兩大類。然而無論是分類或是分群,大多數的演算法都需要用到一個重要的概念:「距離」。
舉例來說,怎麼判斷兩個水果像不像,該不該當成同一類?我們可能會從大小、形狀、顏色或氣味等等特徵的相似與否來做綜合判斷,而這些評判的結果,就是所謂的「距離」。比方說,橘子跟柳丁的距離就比跟西瓜的距離來得近,也就是說:相似度(similarity)越高,距離(distance)就越近。
有的特徵差異是很具體、很容易了解的,例如地圖上的距離,年齡、身高、和體重的差異等等;但有些特徵的差異卻是很抽象而難以表達的,例如愛好食物的種類、職業、國籍,等等。究竟愛吃水果跟愛吃牛排的差異,是不是大於愛吃素跟愛吃雞排的差異?這實在很難比較。
讓我們從實際的例子來看這件事:一個人的國籍是英國,他是跟法國人距離比較近呢,還是跟美國人比較近?從地圖上來看,英國應該是跟法國比較接近,但是從語言上來看卻是美國人跟英國比較相似。這又凸顯了「距離」的另一個問題:當衡量的標準不同的時候,距離也會跟著不同。
要克服這些「定義不明確」、「定義會改變」的狀況,目前比較通用的方式是「以果為因」,讓電腦從大量分類或分群好的資料裡去學習出距離的定義(learning distance metric from data),除了在實務上有效之外,在理論上也符合貝氏機率的觀點。
講了半天,好像還沒講到最遙遠的距離是什麼,這樣有點對不起這個標題。
傳統上,距離的定義是「對稱」的,也就是「我到你的距離」跟「你到我的距離」是一樣的。這在理解上非常容易,台北到高雄的距離,怎麼會跟高雄到台北的距離不同呢?但是近年來,這個限制受到了挑戰,甚至已經被從 metric 的必要條件裡移除了。
我們不妨用另一個例子來看這件事。假設今天吹南風,我坐飛機從台北到高雄需要的時間,跟坐飛機從高雄到台北的時間,是不會一樣的。所以如果我們要量測的「距離」是空中交通所需的時間,那麼自然是不會對稱的。
不對稱的距離,應該也算是種最遙遠的距離吧。
Labels:
data analytics,
thoughts
2012/06/10
[摘譯] 五個讓你創新失敗的方法
原文:Five Ways to Ruin Your Innovation Process
出處:HBR Blog
作者:RITA MCGRATH
大多數的公司企業,常常都在無意中破壞了自己內部創新的流程,作者指出了五種常見的症狀:
出處:HBR Blog
作者:RITA MCGRATH
大多數的公司企業,常常都在無意中破壞了自己內部創新的流程,作者指出了五種常見的症狀:
- 時有時無的創新
- 資源被現有事業單位把持
- 嘗試把創新融入現有運行的架構之中
- 想法不夠多元,離客戶經驗太遠
- 把假設當做知識
Labels:
business,
innovation,
translation
2012/06/02
[摘譯] 尋找萬用記憶體
Source: The Quest for a Universal Memory - IEEE Spectrum
現今的電子產品,從智慧型手機、超輕薄筆電,到一般的桌上型電腦,使用的都是三層式的記憶體架構。
如同圖中所表示,SRAM, DRAM, Flash/HDD 三種記憶體的存取速度和製造成本不同,因此在電腦裡的使用量也不同。
SRAM 的速度最快,與處理器的運作時脈相當,但是相對的製作的難度也高,因此現行架構一般只配置相對少量的 SRAM 來存放處理器立即會運用到的資料。DRAM 的存在某種程度上算是彌補 SRAM 的容量不足,但是跟 SRAM 相同的是兩者同屬於「揮發性」儲存:一旦電源切斷,內部的資料即消失,因此需要「非揮發性」的記憶體來輔助,在現有的架構下也就是 Flash 記憶體或是硬碟。
由此可知,現行的三層架構,是在成本與效能之間取得較佳平衡的解決方案,事實上單一的「萬用記憶體」,一直是電腦架構設計者追尋的目標。以下是幾種目前看起來有希望的萬用記憶體的候選人:
MRAM(magnetoresistive RAM )可以算是最接近「萬用」的記憶體。在硬體架構上,MRAM 可以視為把 DRAM 記憶單元裡的電阻換成磁極,在耗電上比 DRAM 低很多,而資料可以被保存 20 年以上,高於現有的 Flash / HDD。但是,MRAM 在存取速度上還是比 SRAM 慢,而儲存容量也只有 Flash 的十分之一。
RRAM (ReRAM, resistive RAM ) 也是經常被提到的「萬用」候選人之一,基本結構是在絕緣材料上製作微小的導電孔隙,但是會因材料的耗損而喪失記憶性質,目前的發展因為製造上的困難而停滯。
PCRAM(phase-change RAM)算是目前新記憶體技術當中最成熟的,透過改變硫系玻璃的晶態和非晶態來運作。PCRAM 的速度比 DRAM 慢,容量比 Flash 小,因此以目前的三層架構來看,不是特別有吸引力。但是 PCRAM 具有抗輻射的特性,因此在特殊用途(例如航太)的裝置上有其存在的價值。
雖然目前有十餘種萬用記憶體的可能方案,但是似乎還沒有一個可以突破物理學上的限制,而完全取代現有的三層架構。今日電子運算裝置的用途日益多元化,針對不同特殊的用途,有的情況需要的是高速的小量存取,有的情況需要的是大量儲存,所以三層架構恐怕也難以應付所有的情況。因此在以矽晶圓為主的時代結束之前,我們恐怕還會看到更多更複雜的記憶體架構。
現今的電子產品,從智慧型手機、超輕薄筆電,到一般的桌上型電腦,使用的都是三層式的記憶體架構。
如同圖中所表示,SRAM, DRAM, Flash/HDD 三種記憶體的存取速度和製造成本不同,因此在電腦裡的使用量也不同。
SRAM 的速度最快,與處理器的運作時脈相當,但是相對的製作的難度也高,因此現行架構一般只配置相對少量的 SRAM 來存放處理器立即會運用到的資料。DRAM 的存在某種程度上算是彌補 SRAM 的容量不足,但是跟 SRAM 相同的是兩者同屬於「揮發性」儲存:一旦電源切斷,內部的資料即消失,因此需要「非揮發性」的記憶體來輔助,在現有的架構下也就是 Flash 記憶體或是硬碟。
由此可知,現行的三層架構,是在成本與效能之間取得較佳平衡的解決方案,事實上單一的「萬用記憶體」,一直是電腦架構設計者追尋的目標。以下是幾種目前看起來有希望的萬用記憶體的候選人:
MRAM(magnetoresistive RAM )可以算是最接近「萬用」的記憶體。在硬體架構上,MRAM 可以視為把 DRAM 記憶單元裡的電阻換成磁極,在耗電上比 DRAM 低很多,而資料可以被保存 20 年以上,高於現有的 Flash / HDD。但是,MRAM 在存取速度上還是比 SRAM 慢,而儲存容量也只有 Flash 的十分之一。
RRAM (ReRAM, resistive RAM ) 也是經常被提到的「萬用」候選人之一,基本結構是在絕緣材料上製作微小的導電孔隙,但是會因材料的耗損而喪失記憶性質,目前的發展因為製造上的困難而停滯。
PCRAM(phase-change RAM)算是目前新記憶體技術當中最成熟的,透過改變硫系玻璃的晶態和非晶態來運作。PCRAM 的速度比 DRAM 慢,容量比 Flash 小,因此以目前的三層架構來看,不是特別有吸引力。但是 PCRAM 具有抗輻射的特性,因此在特殊用途(例如航太)的裝置上有其存在的價值。
雖然目前有十餘種萬用記憶體的可能方案,但是似乎還沒有一個可以突破物理學上的限制,而完全取代現有的三層架構。今日電子運算裝置的用途日益多元化,針對不同特殊的用途,有的情況需要的是高速的小量存取,有的情況需要的是大量儲存,所以三層架構恐怕也難以應付所有的情況。因此在以矽晶圓為主的時代結束之前,我們恐怕還會看到更多更複雜的記憶體架構。
Labels:
tech,
translation
2012/05/27
Google 輸給 Apple 的理由在員工雇用策略?
目前這個行動與觸控的年代,消費性資訊產品應該可以說是由 Apple 獨領風騷,Business Insider 上有一篇「蘋果大勝 Google 的祕密」(And Here's The Secret Reason Apple Is Crushing Google... - Business Insider),試圖用員工的組成來解釋 Google 的產品為什麼好雖好,卻總是得不到消費者的「心」。
文章裡列出了兩間公司員工畢業學校的前五名,Google 全是傳統的理工科名校,而 Apple 則包括了其他地緣關係較近,但是排名相對不是那麼前面的學校。作者認為,這或許就是造成 Google 產品總是沒辦法打動大多數消費者的心的根本原因。
對於這篇文章的說法,個人有些不同的觀點。由於筆者一向不是很相信學歷,因此傾向於把差異歸結到兩間公司的產品策略上:Apple 是以使用者為中心的產品設計,而 Google 則是以開發者為中心。這樣的出發點,各自執行到極致,約略也就是目前大家看到兩家公司產品屬性的差異了,似乎也不必在員工畢業學校上面做文章。
至於哪種產品策略才對?我想以終端消費者的角度來看,應該不會有人否認目前 Apple 是較為成功的。但是以產品開發商的角度來看,畢竟並不是每個人的產品都是直接賣給消費者的,因此了解自己的客戶,並且以他們的需求為中心開發產品,才是我們真的能從 Apple 的成功上學到的。
附註:Google 在發跡以來常常都被批評只用名校的優秀畢業生,也有人說這些說法都是「自認很優秀卻沒被錄取」的人在網路上散發的批評,無論如何,這樣的刻版印象大概也是文中引述消息來源的想法了。
文章裡列出了兩間公司員工畢業學校的前五名,Google 全是傳統的理工科名校,而 Apple 則包括了其他地緣關係較近,但是排名相對不是那麼前面的學校。作者認為,這或許就是造成 Google 產品總是沒辦法打動大多數消費者的心的根本原因。
對於這篇文章的說法,個人有些不同的觀點。由於筆者一向不是很相信學歷,因此傾向於把差異歸結到兩間公司的產品策略上:Apple 是以使用者為中心的產品設計,而 Google 則是以開發者為中心。這樣的出發點,各自執行到極致,約略也就是目前大家看到兩家公司產品屬性的差異了,似乎也不必在員工畢業學校上面做文章。
至於哪種產品策略才對?我想以終端消費者的角度來看,應該不會有人否認目前 Apple 是較為成功的。但是以產品開發商的角度來看,畢竟並不是每個人的產品都是直接賣給消費者的,因此了解自己的客戶,並且以他們的需求為中心開發產品,才是我們真的能從 Apple 的成功上學到的。
附註:Google 在發跡以來常常都被批評只用名校的優秀畢業生,也有人說這些說法都是「自認很優秀卻沒被錄取」的人在網路上散發的批評,無論如何,這樣的刻版印象大概也是文中引述消息來源的想法了。
Google's Employees
Apple's Employees
2012/05/26
社群網站暴紅的神經生理基礎?
打開Facebook,今天的早餐照片,跟朋友在某家有名小吃店打卡,被客戶刁難的小小抱怨....,成千上萬的人每天在社群網站上公佈自己的點點滴滴,好像人人都迫不及待的告訴別人「我在做什麼」、「我是怎樣的人」。
即便社群網站上有許多隱私權的爭議,像是資料所有權、使用權的歸屬等等;也有人完全不相信網路上有隱私,而對社群網站避之如蛇蠍。但是無論如何,社群網路的成長態勢是有如野火燎原,可以從下面這張來自 Search Engine Journal 的資訊圖中一目了然。
日前一篇發表在 PNAS 的研究,為人類為什麼喜歡談論自己,提供了相當科學的解釋。
這群 Harvard 的心理學家發現,人在談論自己的時候,大腦中負責「獎勵」的 Mesolimbic 區域(主要包含 伏隔核,Nucleus accumbens,和中腦腹側被蓋區,Ventral tegmental area)會有比較強烈的活動,效果就像是這個人得到金錢獎勵一樣。這些學者進一步量測這個獎勵的效果有多大,發現人們甚至願意「付錢」來談論自己的生活經驗與感受。
總之,這個研究指出,人的本性就是喜歡談論自己,或許這也是「分享」與「社群」變成熱門趨勢的根本原因呢?

Source: The Growth of Social Media: An Infographic
即便社群網站上有許多隱私權的爭議,像是資料所有權、使用權的歸屬等等;也有人完全不相信網路上有隱私,而對社群網站避之如蛇蠍。但是無論如何,社群網路的成長態勢是有如野火燎原,可以從下面這張來自 Search Engine Journal 的資訊圖中一目了然。
日前一篇發表在 PNAS 的研究,為人類為什麼喜歡談論自己,提供了相當科學的解釋。
這群 Harvard 的心理學家發現,人在談論自己的時候,大腦中負責「獎勵」的 Mesolimbic 區域(主要包含 伏隔核,Nucleus accumbens,和中腦腹側被蓋區,Ventral tegmental area)會有比較強烈的活動,效果就像是這個人得到金錢獎勵一樣。這些學者進一步量測這個獎勵的效果有多大,發現人們甚至願意「付錢」來談論自己的生活經驗與感受。
總之,這個研究指出,人的本性就是喜歡談論自己,或許這也是「分享」與「社群」變成熱門趨勢的根本原因呢?
Source: The Growth of Social Media: An Infographic
2012/05/19
[Data Analytics] 大資料與小資料
Peter Yared 在 CNet 上的一篇文章中提到這樣的觀點:雖然「巨量資料」(Big Data)目前正熱火朝天,但是以商業用途來說,實際上發揮作用的還是少量關鍵的「小資料」(Little Data)。
以「資料技術的商品化」一書的觀點來看,data analytics 的產品應該是「可採取行動的參考」,而這些「參考」,就是關鍵性的「小資料」。
文章的作者以使用 Google Analytics 分析網站行銷策略為例,Google 收集的網路流量資料非常多,屬於 Big Data,但是最後給行銷管理人員參考的圖表跟指標,其實是相當精簡的 little data,方便管理人員從中獲得洞見。
作者想要表達的建議是:當企業在導入資料分析或商務智慧的解決方案時,焦點不應只放在 Hadoop nodes,資料倉儲等 Big Data 的資訊架構,而忽略了最後輸出的 Little Data 是不是符合企業經營者的需求。
以「資料技術的商品化」一書的觀點來看,data analytics 的產品應該是「可採取行動的參考」,而這些「參考」,就是關鍵性的「小資料」。
文章的作者以使用 Google Analytics 分析網站行銷策略為例,Google 收集的網路流量資料非常多,屬於 Big Data,但是最後給行銷管理人員參考的圖表跟指標,其實是相當精簡的 little data,方便管理人員從中獲得洞見。
作者想要表達的建議是:當企業在導入資料分析或商務智慧的解決方案時,焦點不應只放在 Hadoop nodes,資料倉儲等 Big Data 的資訊架構,而忽略了最後輸出的 Little Data 是不是符合企業經營者的需求。
Labels:
data analytics,
tech
2012/05/10
[Data Analytics] 用數字打擊犯罪
這是 IBM 的電視廣告,美國幾個城市的警局藉由 IBM 的資料分析軟體,分析犯罪資料的時空分佈形態,進而預測犯罪機率高的時間與地點,配合警察巡邏的路線調整,讓重度犯罪降低 30%。
聽起來像是電影關鍵報告(minority report)的情節,只不過警察現在是在罪犯動手之前讓他「多想一下」而打消念頭,而不是直接抓起來。以犯罪心理學的角度來說,這的確是個有效的方法,畢竟大多數的人犯罪都不是預謀良久,或是不做到誓不罷休的。
網路上對這個廣告的批評不少,有人說「當場人贓並獲才算降低犯罪吧」?也有人認為「這樣只不過讓罪犯到另一個地方去犯罪而已」。至於算不算,相信各位看倌心中自有定見。
其實去年 IBM 100週年有一段更長的介紹,幾位紐約警局的警員出來現身說法,敘述與 IBM 的合作案。
無論如何,用數學打擊犯罪,像幾年前的影集數字追兇(Numb3rs)一樣,聽起來倒是挺酷的,至少對宅男來說是如此。
Labels:
data analytics,
funny
[Data Analytics] 科學姓名學?
時代雜誌近日有一篇「行銷人員如何利用嬰兒姓名來預測下一個大事件」(How Baby Names Can Help Marketers Predict the Next Big Thing),講的是利用初生兒姓名的統計模型,來分析與預測社會文化的演變。
這篇報導主要是根據一篇即將發表的研究:From Karen to Katie: Using Baby Names to Understand Cultural Evolution(手稿在此),作者發現:即使每個父母心裡想的都是要幫子女取個獨一無二的名字,但是若以姓名的發音來看,事實卻不盡然是如此。
Labels:
data analytics,
news
2012/05/09
[Data Analytics] 資料報導 data journalism
資料報導 (Data Journalism) 是一種新形態的報導流程,利用分析大量的資料來作為報導內容的基礎。
如同左圖所顯示的,整個流程包括從資料的收集、整理、視覺化,到報導內容的產生,這跟社會科學研究的流程多有類似之處,而這類報導也常常與社會、經濟議題有關。
Labels:
data analytics
2012/05/05
[Books] 麥肯錫寫作技術與邏輯思考
作為全球最知名的企管顧問公司,麥肯錫(McKinsey & Company)除了綿密的政商人脈之外,也自有其訓練員工的獨門心法。這本「麥肯錫寫作技術與邏輯思考」,算是一個簡單的介紹,雖然書籍的內容是聚焦在商業書寫方面,但是其實學術論文寫作的技巧也大同小異,而清楚有效的溝通,更是從事任何工作必備的技能。
2012/04/14
[Data Analytics] 資料技術的商品化
Big Data 作為一項熱門的話題,討論得熱火朝天,但是我們總免不了會好奇,這樣的技術,要怎樣轉化成產品?又會是怎樣的商業模式?
O'Reilly Media 最近上架了一本小書:Designing Great Data Products(可免費下載),討論的恰好是這樣的問題。
O'Reilly Media 最近上架了一本小書:Designing Great Data Products(可免費下載),討論的恰好是這樣的問題。
Labels:
books,
data analytics
2012/04/06
[Data Analytics] 基本概念:模型與預測
大部份「資料分析」的目的,是為了理解我們觀察到的現象背後的脈絡,並且藉由這些觀察所得到的洞見,來對往後的現象作出預測。
雖然有人把各種分析的方法,區分成質化跟量化兩大領域,但是這些分析工具的目的卻是一致的:用系統化的方式,把觀察和經驗轉化成知識。
雖然有人把各種分析的方法,區分成質化跟量化兩大領域,但是這些分析工具的目的卻是一致的:用系統化的方式,把觀察和經驗轉化成知識。
Labels:
data analytics,
tech
2012/03/25
提昇創造力的幾個小技巧
「創新」大概是當今主流文化最熱衷於追求的價值。
華爾街日報日前有篇報導「如何像 Jobs 一樣有創造力」,選編自喬納‧萊雷爾(Jonah Lehrer)的著作《想像:瞭解創造力的機理》(Imagine: How Creativity Works,Houghton Mifflin Harcourt),摘錄了一些提高創造力的小技巧,像是做做白日夢、看些輕鬆幽默的材料放鬆一下、喝點小酒....等等。
華爾街日報日前有篇報導「如何像 Jobs 一樣有創造力」,選編自喬納‧萊雷爾(Jonah Lehrer)的著作《想像:瞭解創造力的機理》(Imagine: How Creativity Works,Houghton Mifflin Harcourt),摘錄了一些提高創造力的小技巧,像是做做白日夢、看些輕鬆幽默的材料放鬆一下、喝點小酒....等等。
2012/03/22
[Data Analytics] Big Data 智慧的基礎
這期數位時代的主題「Big Data 數字鍊金」,就描述得頗為傳神。
Labels:
data analytics,
news,
tech
2012/03/18
770 年的時代雜誌
日前 mbaonline 發表了一張 A Day in the internet 的資訊圖表,當中提到每天有兩百萬篇的文章發表,內容足以讓 Time Magazine 發行 770 年。
想到自己也是共犯之一,罪過罪過。
不過幸好網上發文不必砍樹,這樣可以稍微心安一點。
想到自己也是共犯之一,罪過罪過。
不過幸好網上發文不必砍樹,這樣可以稍微心安一點。
拖延地圖
Procrastination,拖延,大概算是很常見的壓力下的反應,至少我常常在周遭的人身上觀察到。
從心理學的觀點來看,人在面對焦慮的時候,常常會轉移注意力,不去處理造成焦慮的壓力源,反而去從事其他的活動,來減輕焦慮。
從心理學的觀點來看,人在面對焦慮的時候,常常會轉移注意力,不去處理造成焦慮的壓力源,反而去從事其他的活動,來減輕焦慮。
2012/02/28
遊戲式的線上學習
最近玩了一陣子 Codecademy ,覺得還蠻有趣的。根據數位時代的報導:
Codecademy 是一個程式語言教學服務,透過一個指示配合一段演練的方式,再加上結合遊戲化的機制,為使用者規劃出逐步但全面....程式語言的實作。....Codecademy的共同創辦人Zach Sims表示,他們的目標,是希望所有完成全部課程的使用者,在一年結束後,都能成為足以勝任相關工作的程式開發者。
2012/02/19
[摘譯] 不是大老闆,該如何創新?
Source: How to Innovate When You're Not the Big Boss
原作者:John Beeson
高階專業經理人需要的智慧,不只是如何為組織進行根本性的改變與重整,也包括在組織進行改變之前,給予需要的時間與準備。
事實上,絕大多數的公司都有相同的現象:中階經理人普遍的抱怨自己得不到推動創新與變革所需要的資源跟影響力,抱怨高階管理階層「不願意冒險」、「不讓我們進行創新」。
原作者:John Beeson
高階專業經理人需要的智慧,不只是如何為組織進行根本性的改變與重整,也包括在組織進行改變之前,給予需要的時間與準備。
事實上,絕大多數的公司都有相同的現象:中階經理人普遍的抱怨自己得不到推動創新與變革所需要的資源跟影響力,抱怨高階管理階層「不願意冒險」、「不讓我們進行創新」。
Labels:
business,
thoughts,
translation
2012/02/16
[摘譯] 消失的職場陞官圖
原文:There Is No Career Ladder
出處:HBR Blog Network
作者:PRISCILLA CLAMAN
「進入一間公司,透過持續的努力慢慢的在陞官圖(career ladder)上升遷,最後爬到頂點」,以我多年生涯規劃顧問的經驗,這樣的生涯發展模式,在過去15年內已經逐漸消失。
出處:HBR Blog Network
作者:PRISCILLA CLAMAN
「進入一間公司,透過持續的努力慢慢的在陞官圖(career ladder)上升遷,最後爬到頂點」,以我多年生涯規劃顧問的經驗,這樣的生涯發展模式,在過去15年內已經逐漸消失。
Labels:
business,
thoughts,
translation
2012/02/02
[摘譯] 十個即將改變消費電子走向的技術(四)(完)
原文:Ten technologies that will shake the CE world
出處:EETimes
出處:EETimes
- Motion processing
- GPU compute
- Ubiquitous Android
- The ARMing of Win8
- Touch-free HMIs
- Talkative intelligent agents
- Graphene as the new silicon
- Embedded vision
- Home health hubs
- Location-based services
Labels:
news,
tech,
translation
2012/02/01
[摘譯] 十個即將改變消費電子走向的技術(三)
原文:Ten technologies that will shake the CE world
出處:EETimes
出處:EETimes
- Motion processing
- GPU compute
- Ubiquitous Android
- The ARMing of Win8
- Touch-free HMIs
- Talkative intelligent agents
- Graphene as the new silicon
- Embedded vision
- Home health hubs
- Location-based services
Labels:
news,
tech,
translation
2012/01/30
[摘譯] 十個即將改變消費電子走向的技術(二)
原文:Ten technologies that will shake the CE world
出處:EETimes
出處:EETimes
- Motion processing
- GPU compute
- Ubiquitous Android
- The ARMing of Win8
- Touch-free HMIs
- Talkative intelligent agents
- Graphene as the new silicon
- Embedded vision
- Home health hubs
- Location-based services
Labels:
news,
tech,
translation
2012/01/29
[摘譯] 十個即將改變消費電子走向的技術(一)
原文:Ten technologies that will shake the CE world
出處:EETimes
出處:EETimes
- Motion processing
- GPU compute
- Ubiquitous Android
- The ARMing of Win8
- Touch-free HMIs
- Talkative intelligent agents
- Graphene as the new silicon
- Embedded vision
- Home health hubs
- Location-based services
Labels:
news,
tech,
translation
2012/01/28
知其黑,守其白
事情可以從一則新聞說起:道德沉淪 李家同批好萊塢電影。
姑且不論李校長批評的有沒有道理,其實「對犯罪行為的揭露是否會對社會大眾形成不良示範」的說法,從有新聞媒體以來,一直都有爭議,去年五月兒少法修正的爭議,就是一個最近的例子。
反對報導犯罪細節的人士,一般來說是認為這樣會「教壞因仔大小」,讓原本單純善良的人學壞;但是贊成這種報導的人,則是持著「要知道壞人是怎麼做的,才能避免受害」的論點,似乎也不是全無可取之處。
姑且不論李校長批評的有沒有道理,其實「對犯罪行為的揭露是否會對社會大眾形成不良示範」的說法,從有新聞媒體以來,一直都有爭議,去年五月兒少法修正的爭議,就是一個最近的例子。
反對報導犯罪細節的人士,一般來說是認為這樣會「教壞因仔大小」,讓原本單純善良的人學壞;但是贊成這種報導的人,則是持著「要知道壞人是怎麼做的,才能避免受害」的論點,似乎也不是全無可取之處。
2012/01/15
遊戲化(gamification)的,與太遊戲化的
遊戲化(gamification)是個新名詞,指的是用遊戲設計的概念或遊戲的機制來解決問題,或是作為與群眾交流的介面。它的應用從日常生活中經常見到的「小遊戲行銷」,到科學家把 DNA 立體結構的搜尋改寫成遊戲(fold.it)讓玩家一起參與解迷,可以說是相當熱門的話題。
2012/01/11
[Data Analytics] 從資料視覺化到資訊圖表
Labels:
data analytics,
tech,
thoughts
訂閱:
文章 (Atom)